文件输入/输出入门:数据持久化
文件 输入/输出(I/O)是 Python 程序从外部源(如硬盘、网络流或设备)读取数据,或向其写入数据的基本过程。这一机制至关重要,因为它提供了 数据持久化,确保数据在 Python 脚本执行结束后仍能被保存并持续访问。
1. 内存与持久存储
变量和程序数据临时存储在随机存取内存(RAM)中。RAM 是 易失性;当脚本停止运行时,所有存储的值都会立即被清除。文件 I/O 将数据从易失性内存(RAM)转移到非易失性存储(磁盘),使其永久保留。
概念性示例:
如果用户在会话期间设置了配置值,该值必须写入外部配置文件(如 JSON 或 INI 格式),以便程序在下次运行时能够加载并识别它。
2. 文件 I/O 的基础应用
能够与文件系统交互的能力在软件工程的所有领域都至关重要:
- 日志记录与审计:生成操作日志、错误报告或跟踪用户活动以供后续审查(在质量保证中至关重要)。
- 配置管理:读取初始化应用程序所需的设置文件(例如环境变量、API 密钥)(在网页开发中很常见)。
- 数据集处理:处理、加载和保存机器学习与数据科学任务所需的大规模数据集(如 CSV、JSON、XML)。
核心机制
Python 使用内置的
open() 函数 来建立程序与外部文件之间的连接(一个‘文件对象’或‘句柄’)。此过程需要指定一个 模式(读取、写入、追加),并确保连接在之后被正确关闭。
TERMINALbash — 80x24
> Ready. Click "Run" to execute the simulation.
>